中国av高清_x8x8女性性爽免费视频app_久久人人97超碰人人爱电影_麻豆免费av_亚洲精品乱码97久久久_琪琪久久影院

武漢大成美育科技開發有限公司

AI向真正“智能學習體”邁進

信息來源:www.www.v0830.com   2021-03-12 16:09:51

英國《自然》雜志24日發表一項人工智能研究成果:美國團隊報告了一類增強學習,可回溯過去、解決復雜任務,真正改善了對復雜環境的探索方式,有望應用于機器人、語言理解和藥物設計領域。這類算法被統稱為“Go-Explore”,其已經在一款經典游戲的算法挑戰中得分超過了人類玩家和人工智能系統。該成果被認為正朝著實現真正“智能學習體”邁出了重要一步。

增強學習,可讓人工智能系統通過探索和理解復雜環境來進行決策,并學習如何以好的方式獲得獎勵。獎勵可以包括機器人抵達特定位置或是在電腦游戲中達到一定的等級。然而,當遇到很少給予反饋的復雜環境時,現階段的加強學習算法就很容易碰壁,這讓人工智能專家們非常苦惱。

美國“OpenAI”是由諸多硅谷巨頭聯合建立的人工智能非營利組織,推動者包括美國創業孵化器Y?Combinator總裁薩姆·阿爾特曼、美國太空技術探索公司(SpaceX)創始人埃隆·馬斯克等,其目標是希望能夠預防人工智能的災難性影響,并推動人工智能發揮作用。此次,“OpenAI”的科學家艾德蘭·艾克菲特、朱斯特·赫伊津哈及團隊,提出了有效探索面臨的兩個主要障礙,并設計了一類算法來解決這些障礙。

研究人員表示,“Go-Explore”可以對環境進行探索,同時構建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的期中階段或是勝利(獎勵)的路線。其在雅達利經典游戲中的得分,超過了人類玩家和人工智能系統,研究人員用這類算法,解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。

“Go-Explore”算法還能完成一個模擬機器人任務,在這項任務中,它必須用機械臂把東西撿起來并放到4個架子中的一個架子上,其中兩個架子被關在兩扇門的后面。

研究人員指出,記住并回到有望成功的探索區域的簡單原則是一種強大、通用的探索方法。他們認為新的算法有望應用于機器人、語言理解和藥物設計。

主站蜘蛛池模板: 秭归县| 永安市| 招远市| 许昌市| 博野县| 兴宁市| 大石桥市| 贡觉县| 正宁县| 大荔县| 甘孜县| 渑池县| 博兴县| 礼泉县| 萝北县| 那曲县| 荔浦县| 绵竹市| 长沙市| 永德县| 景泰县| 金门县| 南溪县| 洮南市| 当阳市| 曲麻莱县| 镇江市| 常山县| 句容市| 福建省| 临夏市| 嘉义县| 太原市| 定边县| 康乐县| 榆中县| 清徐县| 偏关县| 湖南省| 古丈县| 神农架林区|